Greater
逐元素比较两个输入张量,判断 input1 的元素是否大于 input2 的对应元素。支持广播。
\[\text{output}_i = (\text{input1}_i > \text{input2}_i)\]
输出一个布尔张量,如果比较结果为真,则对应元素为 true,否则为 false。
- 输入:
element_num - 输出张量的总元素数量。在广播情况下,等于较大输入张量的元素数量。
optimize - 广播优化标志。若为非0,则启用广播模式。
in_elements_num0 - 第一个输入张量 input1 的元素数量。用于广播判断。
input1 - 第一个输入张量的数据地址。
input2 - 第二个输入张量的数据地址。
output - (输出) 输出的布尔类型张量的数据地址。
core_mask - 核掩码。
- 输出:
output - 写入比较结果的布尔张量。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持fp32, fp64, int8, int16, int32
MT7004 支持fp16, fp32, int16, int32
共享存储版本:
-
void fp_greater_s(int element_num, int optimize, int in_elements_num0, float *input1, float *input2, bool *output, int core_mask)
-
void hp_greater_s(int element_num, int optimize, int in_elements_num0, half *input1, half *input2, bool *output, int core_mask)
-
void dp_greater_s(int element_num, int optimize, int in_elements_num0, double *input1, double *input2, bool *output, int core_mask)
-
void i32_greater_s(int element_num, int optimize, int in_elements_num0, int32_t *input1, int32_t *input2, bool *output, int core_mask)
-
void i16_greater_s(int element_num, int optimize, int in_elements_num0, int16_t *input1, int16_t *input2, bool *output, int core_mask)
-
void i8_greater_s(int element_num, int optimize, int in_elements_num0, int8_t *input1, int8_t *input2, bool *output, int core_mask)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <greater.h>
4int main(int argc, char* argv[]) {
5 float *input1 = (float *)0xA0000000; // Scalar input, DDR
6 float *input2 = (float *)0xB0000000; // Tensor input
7 bool *output = (bool *)0xC0000000; // Output
8
9 // Broadcasting input1 (scalar) > input2 (tensor)
10 int element_num = 4096; // Size of input2 and output
11 int optimize = 1; // Enable broadcasting
12 int in_elements_num0 = 1; // Size of input1
13 int core_mask = 0xff;
14
15 fp_greater_s(element_num, optimize, in_elements_num0, input1, input2, output, core_mask);
16 return 0;
17}
私有存储版本:
-
void fp_greater_p(int element_num, int optimize, int in_elements_num0, float *input1, float *input2, bool *output)
-
void hp_greater_p(int element_num, int optimize, int in_elements_num0, half *input1, half *input2, bool *output)
-
void i32_greater_p(int element_num, int optimize, int in_elements_num0, int32_t *input1, int32_t *input2, bool *output)
-
void i16_greater_p(int element_num, int optimize, int in_elements_num0, int16_t *input1, int16_t *input2, bool *output)
-
void i8_greater_p(int element_num, int optimize, int in_elements_num0, int8_t *input1, int8_t *input2, bool *output)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <greater.h>
4int main(int argc, char* argv[]) {
5 float *input1 = (float *)0x10000000; // Tensor input, L2
6 float *input2 = (float *)0x11000000; // Scalar input
7 bool *output = (bool *)0x12000000; // Output
8
9 // Broadcasting input1 (tensor) > input2 (scalar)
10 int element_num = 1024; // Size of input1 and output
11 int optimize = 1; // Enable broadcasting
12 int in_elements_num0 = 1024; // Size of input1
13
14 fp_greater_p(element_num, optimize, in_elements_num0, input1, input2, output);
15 return 0;
16}